AI产业链地图·知识库 DeepSeek R1 · 概念
🚧 网站建设中 更新 2026·06·17 → 产业链图谱
首页/概念/DeepSeek R1
更新 2026·06·17
概念 技术 / 术语

DeepSeek R1

DeepSeek-R1 · R1 · R1-Zero

DeepSeek V3R1-Zero(纯 RL 训练)→ R1(SFT + RL)→ 蒸馏小模型多版 → 集成入 DeepSeek V4(路线图统一)

DeepSeek R1 CONCEPT · 概念
首次提出
2025
关键参与方
[[DeepSeek]] · [[幻方量化]]
反向引用
23 处 · 来自 15
归属 大模型开源模型DeepSeek推理模型MoE第四层

DeepSeek R1

DeepSeek 2025-01-20 发布的开源推理专精大模型(与 OpenAI o1 / o3 同档),671B MoE 架构基于 DeepSeek V3 通过强化学习训练而成,是 2025-01 "DeepSeek 时刻"的引爆芯片,引发全球大模型推理范式重定价。

关键规格

维度 数值
发布 2025-01-20
参数 671B 总 / 37B 激活(基于 V3)
上下文 128K tokens
训练方法 纯 RL(R1-Zero)+ 监督微调(R1)
模态 文本
许可证 MIT 完全开源
蒸馏小模型 R1-Distill-Llama-70B / R1-Distill-Qwen-32B 等

市场定位

R1 战略意义:

  • 首款开源对标 o1 的推理模型 —— 性能在 AIME / MATH / Codeforces 等评测追平 o1
  • 完全开源 + 论文公开 —— 算法细节(GRPO、self-play RL)全部公开
  • 蒸馏小模型 —— 释放多个 7B / 32B / 70B 蒸馏版,企业可低成本部署
  • DeepSeek 时刻 —— 2025-01 引发 NVIDIA 暴跌 + 全球算力需求重估
  • 推动 OpenAI / Anthropic 把推理模型纳入主力(GPT-5 统一思路、Claude 4 Extended Thinking)

客户与部署

  • API —— DeepSeek 官方 API(价格仅 $0.55/M input, $2.19/M output,远低于 o1)
  • 企业自部署 —— 多家公司基于 R1 二次训练
  • 云服务 —— 各大云厂商第一时间上架(Together AI, Fireworks, AWS Bedrock 等)

演进路线

DeepSeek V3R1-Zero(纯 RL 训练)→ R1(SFT + RL)→ 蒸馏小模型多版 → 集成入 DeepSeek V4(路线图统一)

关联

↑ up::DeepSeek 幻方量化 DeepSeek V3 ↓ down::4-04-模型部署与优化 5-04-AI编程助手 ⚔ competitor::GPT-5 Claude Opus 4 ∈ belongs_to::4-02-模型工厂